導讀:像pR劫持一樣,對一些比較難以預防的黑帽陷害手法,本來不太想積極討論,因為有很多時候會對無辜的站長造成很大的傷害。在前兩天的SEO案例中,提到了代理劫持(proxy hijack),有人問是
發(fā)表日期:2020-07-05
文章編輯:興田科技
瀏覽次數(shù):8169
標簽:
像pR劫持一樣,對一些比較難以預防的黑帽陷害手法,本來不太想積極討論,因為有很多時候會對無辜的站長造成很大的傷害。
在前兩天的SEO案例中,提到了代理劫持(proxy hijack),有人問是怎么回事,今天就解釋一下。像這種東西都是雙刃劍,不懷好意的人看了,又多了一個損人利己的工具。另一方面,已經(jīng)深受其害的站長看了,也許對他們預防和恢復有正面意義。
代理劫持簡單說就是搜索引擎收錄了通過代理服務器瀏覽的網(wǎng)頁,而把原本真正的網(wǎng)頁懲罰或刪除。
國內站長對代理服務器(proxy server)肯定都很熟悉。在使用代理服務器上其他網(wǎng)站時,瀏覽器顯示的URL通常是類似于:
http://www.proxysite.com/proxy/www.proxysite.com
其中proxysite.com是代理服務器域名,proxysite.com是真正要訪問的網(wǎng)站。
在瀏覽器打開這種URL當然沒問題,但如果搜索引擎抓取了這種URL,就會對原來的網(wǎng)站形成完全復制內容網(wǎng)頁。雖然復制內容網(wǎng)頁在絕大部分情況下只是被忽略不計,但在某些情況下,搜索引擎判斷錯誤,會把原始的版本當做是復制而被懲罰甚至被刪除。
一般情況下,通過代理訪問的URL不應該被收錄。但如果有人惡意鏈接向這個代理URL,搜索引擎也會訪問和抓取。
怎么預防或恢復被代理劫持的排名呢?
最簡單的,如果看到自己的網(wǎng)頁被代理劫持,查一下那個代理服務器的Ip地址,自己服務器上把那個Ip地址屏蔽掉,禁止抓取。
但有的時候,代理服務器的Ip地址會有變化,而且代理服務器又那么多,很可能屏蔽不過來。更復雜的方法是服務器端通過程序鑒別來訪問的是否是搜索引擎蜘蛛,是否是真正的搜索引擎蜘蛛。
有些情況下,搜索引擎蜘蛛通過代理URL訪問時的瀏覽器類型(User Agent),還是搜索引擎的蜘蛛。不過,有的代理服務器可能設置為隱藏原始Ip地址,隱藏User Agent,這就給判斷是否是搜索引擎蜘蛛造成很大困難。
這時網(wǎng)站程序就需要主動驗證來訪的是否是真的搜索引擎蜘蛛。如果程序檢驗確實是真實的蜘蛛,就返回正常頁面。如果檢測不是蜘蛛是正常用戶,或是假冒的蜘蛛,那么返回的網(wǎng)頁都加入noindex,nofollow標簽。這樣這些原始網(wǎng)頁通過代理訪問時,都不能被搜索引擎所抓取。
Google2月份發(fā)表在黑板報及網(wǎng)站管理員博客的翻譯Matt Cutts的怎樣驗證Google蜘蛛帖子(Matt Cutts的原貼沒發(fā)在自己的博客,而是發(fā)在英文版網(wǎng)站管理員博客),不是發(fā)著玩的,而是有很深的意義。從目前零個引用鏈接和評論看,大部分人不知道這個帖子有什么用。
按說搜索引擎對這種代理劫持應該有辦法判斷,不然這就成了一些人可以陷害競爭對手的簡易方法。不過,任何算法都有漏洞,就算算法能99%的正確判斷,但是漏網(wǎng)的那一個錯誤就可能使無辜的網(wǎng)站被刪除。
寫這篇文章是希望介紹給跟多人,讓大家能更好的預防。使用這種方法意圖陷害他人,相信大家都會十分鄙視的。
很少寫帖子時想,看懂的人越少越好。這是一篇。
上一篇:
暫無信息更多新聞
2020
關于seo,對于很多剛開始創(chuàng)業(yè)的朋友們來說,都會選擇網(wǎng)絡的方式來營銷,擴大知名度和影響力,讓網(wǎng)站能夠吸引更多人加入其中,并且成為忠實的粉絲,獲得多方面的利
View details
2020
關于網(wǎng)站優(yōu)化,大家可能都了解,創(chuàng)業(yè)的第一步就是找到客戶,那在以前創(chuàng)業(yè)的時候要想找到自己公司的目標客戶都是使用傳統(tǒng)的銷售模式,要不就是朋友介紹這樣的
View details
2020
關于關鍵詞排名,對于網(wǎng)站建設前期的一個規(guī)劃關系著一個網(wǎng)站建設得是否成功,網(wǎng)站建設前需明確建設網(wǎng)站的目的,確定網(wǎng)站的功能和規(guī)模,進行必要的市場分析,只
View details
2020
關于關鍵詞優(yōu)化,首先我們要讓現(xiàn)在消費者不太好、有需求,首先想到的就是搜索引擎,在搜索引擎輸入關鍵字,查尋相關的結果,換句話說通過搜索引擎來認知和答疑
View details